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음성 합 성 은 기 본 적 으로 컴 퓨 터 나 기 계 가 인 간 의 음 성 을 합 성 해 발 화 하도록 하는 기 술 이 
다. 음성 합 성 은 사 람 의 육 성 을 직접 사 용 하 지 않고 자 동 으로 책 을 읽 어 주는 프 로 그 램 이 나 기 
차 역 같은 곳 에 서 흘 러 나오는 장내 방송 등 을 통해 접할 수 있을 정도로 의외로 우 리 의 생활 
에 밀 접 하 게 다가와 있다. 음성 합 성 은 단순히 정해진 문 장 만을 읽는 것에서 우 리 말 을 외국어 
로, 외 국 어 를 우 리 말 로 자동 통 역 하는 과 정 에서도 사용할 수 있는 기 술 로 음성 합 성 의 기본 
원 리 가 그렇게 복 잡 하지는 않다. 그러나 오늘날 사 람 이 말하는 것과 같이 자연스럽게 함 성 음 
을 구 현 하는 것은 쉽 지 는 않다. 본 논 문 에서는 음 성 합 성 의 기본 원 리 에 대해 살 펴 보 고, 음성 
합 성 을 쉽게 이 해 하고 적 용 해 볼 수 있는 연결 음성 합 성 을 소 개 한 다 


11. 음성 합 성 의 기본 원리 


기 차 역 에서 가장 많이 들을 수 있는 것은 "116 6310 195 60400 107 00." 라 는 장내 방 송 이다. 
이러한 장래 방 송 을 하기 위해서 일일이 모든 문 장 을 녹 음 하는 것도 한 가지 방 법 이 다. 보다 
적은 노 력 으로 합 성 한다면 "00" 로 표시된 부 분 은 따로 녹 음 해 음성 자 료 로 만들어 두고, 임의 
로 역 명 을 정해 위에 해 당 하는 하 나 의 문 장 만을 녹 음 한 후 00 에 해 당 하는 항 목 은 자 판 에 입 
력 하면 녹 음 되어 있는 음성 자 료 에서 자 동 으로 음 성 을 불 러 드 리 도록 하는 방 법 을 사용할 수 
있다. 기본 문장 외에 더 필요한 음성 자 료 는 목 적 지 를 나 타 내 기 위한 “ 버 666004784, 
바 끼 3061048, 씨 6\20<, 찌 607/ 04" 등 의 역 명 이다. 이렇게 함으로써 모든 문 장 을 일일이 녹음 
할 필 요 가 없기 때문에 음성 자 료 를 저 장 하기 위한 기억 공 간 도 많이 필 요 하지 않다는 장점 
이 있다. 이 과 정 을 통해 구 축 된 역명 음 성 자 료 는 다른 내 용 의 공 지 사 항 이 있더라도 기본적인 
하 나 의 문장 하나만 생 성 하면 역 명 과 시 각 에 따라 일일이 다시 녹 음 할 필요 없이 간단히 대 
치가 가 능 하 다. 예로 제시된 음성 합 성 의 과 정 을 그 림 으로 나타내면 다 음 과 같다. 


[ 외 국 어 교육] 제 17 집 







버 타 60090 
바 끄 30610128 










1116 0 ㅁ 810 16 00000 10 : 


= 

= 
그림 1. 어구 단위 음성 합 성 의 예 

위에 제시된 예 에서는 음성 합 성 의 단 위 를 어절 또는 어구, 개별 단어 등 으로 비교적 큰 


으 

개? 
단 위 를 사 용 하고 있지만, 몇 가지 유 형 에 따른 문 장 이 정해져 있지 않고, 결 과 물 로 생 성 해야 
할 문 장 이 수 만 개 라면 새로운 어 절 이나 어 구 가 등 장 할 때 마다 일일이 녹음 
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인 리 를 구현해 사 람 의 목 소 리 를 직접 활 용 하지 않고 순 수 하게 인 공 적 인 합 성 음 을 생 성 하 
방 법 과 사 람 의 목 소 리 를 직접 활 용 하여 녹 음 된 음 파 를 저 장 했 다 가 음성 합 성 에 이용하는 
법 으로 구분할 수 있 트 합성 


있다. 전 자 에 속하는 음성 합성 기 법 은 규칙 기반 포 먼 

1416708660 00018 5070116915 과 조음 기반 음성 합성 301041060017 550801691 이 해 당 되 고, 후자 
의 경 우 에는 코 퍼 스 기반 연결 음성 합성 00000[600076 550116916 과 14041 기반 음성 합성 
속한다. 본 논 문 에 서는 이 중 코 퍼 스 기반 연결 음성 합성 00003[608076 55001691 에 대한 


기본 원 리 와 웅 용 에 대해 살 펴 보 고자 한다. 





음 성 합 성 은 크게 인 간 의 조음 기 관 과 발성 원 리 를 구현해 사 람 의 목 소 리 를 직접 활 용 하지 
않고 순 수 하게 인 공 적 인 합 성 음 을 생 성 하는 방 법 과 사 람 의 목 소 리 를 직접 활 용 하여 녹 음 된 
음 과 를 저 장 했 다 가 음성 합 성 에 이용하는 방 법 으로 구분할 수 있다. 전 자 에 속하는 음성 합성 
기 법 은 규칙 기반 포 먼 트 합 성 과 조음 기반 음성 합 성 이 해 당 되고, 후 자 의 경 우 에는 코 퍼 스 
기반 연결 음성 합 성 과 8004 기반 음성 합 성 이 속한다. 이 장 에서는 이러한 합성 방 식 에 대 
한 기본 원 리 를 살 펴 보 고 음향 음 성 학 적 으로 활 용 과 구 현 이 비교적 쉬운 코 퍼 스 기 반 연결 음 
성 합 성 에 대해 자세히 살 펴 보 고자 한다. 
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1. 규칙 기반 포 먼트 합성 


기반 포 먼트 합성 기 법 이 등 장 하기 이 전 에 처 음 으로 체 계 화 된 음성 합 성 기 의 모 습 을 


트 
은 1939 년 뉴욕 세 계 박 람 회 에서 선보인 "700600204016 아 01, 1939)" 합 성 기 였다. 
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그림 2. 00@ 음성 합 성 기 (24016 하 1., 1939; 1013(1987) 에 서 재 인 용 ) 


7006@ 합 성 기 는 피아노 건 반 을 두드리는 것처럼 인 간 이 직접 손 과 발 을 사용해 조 작 하도 
록 설 계 되었다. 유 / 무 성 음원 701008 504706 과 소음 음원 00166 500706 을 통 제 하는 손 목 봉 


\09【 681, 성대 진 동 의 기본 주파수 [000801004101 18604000/ 를 조 절 하 는 밝 기 판 (00 ㅁ 6021 으 
로 구 성 되어 있다. 음 원 은 10 개 의 대역 통과 전자 필터 63007855 016 아 00010 101166 를 거 치 면 서 
개별 소 리 를 생 성 하도록 고 안 되었고 출 력 의 크 기 는 사 람 이 직접 조 작 하도록 설 계 되었다. 문장 
합 성 음 을 생 성 하 기 위해서는 상당한 노 력 과 기 술 이 필 요 했고, 합 성 음 의 이 해 가능성 
1 까 601816415 는 미 미 했지만 음성 합 성 의 가 능 성 을 열 어 준 모 델 이었다. 

이어서 등장한 것은 해 스킨스 연구소 1109009 1.00070100 에 서 개 발 한 "유형 재생 3160 
민 3/080< 합 성 기 였 다 (2007@ 이 1. 1951). 
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그림 3. 유형 재생 합 성 기 (20006 하 1., 1951; 134(1982) 에 서 재 인 용 ) 


이 합 성 기는 120 112 간 극 의 고조파 18000010 진폭 300014406 을 광 학 적 으로 조 작 해 스펙 
트 로 그램 정 보 가 담긴 0417 용 지 에 통 과 시켜 소 리 를 생 성 하는 모 델 이다. 광학적 에 너 지 가 광 
원 1194 500706 에 서 출 발 해 실린더 렌즈 601. 1608 를 거쳐 음조 조절 바퀴 1006 \468 에 서 120 
132 간 극 의 고 조 파 가 생 성 되고, 렌 즈 를 통 과 한 이 고 조 파 는 거 울 을 거쳐 스 펙 트 로 그 램 정 보 가 
칠해진 움직이는 (017 용 지 에 투 과 되면서 시 간 축 에 따른 소 리 를 생 성 하는 원 리 이다. 이 모델 
은 주로 음절 단 위 의 합 성 음 을 생 성 해 다양한 음 성 을 변 별 하는 하는데 사 용 되 었다. 

700@ 와 유형 재생 함 성 기가 스 펙 트 로 그 램 의 유 형 을 활 용 해 함 성 을 시도한 것이라면 규칙 
기반 포 먼 트 합성 기 법 은 음 성 이 생 성 되 는 음향 이 론 을 바 탕 으로 소 스 - 필 터 모델 600706-+116 
0081 을 충실히 반영한 합성 방 식 으로 규 칙 에 의해 개 별 음 을 직접 생 성 하고 조 합 하는 방식 
이다. 이 방 식 에서는 음 성 파 의 생성 기 구 를 음 원 의 생 성 과 성 도 의 형 태 에 의한 조 음 (필터 특 
성 ) 으 로 나누어 규 칙 에 따라 음 원 과 성도 특 성 을 제 어 함으로 합 성 음 을 생 성 하였다. 
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그림 4. 07207 \"6005 티 60049 Ｌ (0\ 1; 16 까 & 43007 1962; 113(19872) 에 서 재 인 용 ) 





위 그 림 은 초기 포 먼트 합 성 기 중의 하 나 인 (072[07 \010015 14160005(0\ 1; 137 1953) 가 진 
화한 0\Ｌ1 의 계 통 도 이다. 크게 세 영 역 의 회 로 로 분 화 되어 있는데 가장 상 단 의 '1[1+13" 
부터 5141' 까 지는 모음, 중 간 의 '10' 부 터 '11' 까 지는 비음, 하 단 의 '0' 부 터 '<2' 까 지는 장애 
음 의 성도 전이 기능 70031 0 ㅠ 8 아 8096 104000107 을 구 현 한 것이다. 음원 90000 504606 의 경 
우 상 단 의 성대 진동 발 성 부 00166 80 ㅁ 에서 시 작 되 는 성대 진동 형성 회로 04166 10001408 
0040 따 는 유 / 무 성 701008 을 통 제 하 고, 소음 발 성 부 00166 80 경우 중 간 의 소음 형성 회로 
1700196 1000008 000 빠 는 기 식 35008007 소 음 을, 하 단 의 소음 형성 회 로 는 마찰 108007 소음 
을 통 제 한 다. 

실제로 이러한 회 로 를 통 제 하고 소 리 를 생 성 하기 위해서는 각 부 분 을 적 절 하게 통 제 할 수 
있는 복잡한 규 칙 이 필 요 하 다. 그리고 직접 회 로 를 작 동 해 소 리 를 생 성 하 기 보다는 컴 퓨 터 를 
활 용 해 회 로 의 기 능 을 대 치 하게 된다. 이러한 규 칙 을 바 탕 으로 최초로 음 소 를 합 성 한 것은 
6 기 (386690080(1961; 1962) 이 최 초 였고, 이후 합 성 의 효 율 성 과 자 연 성 을 향 상 시키기 위해 
음 원 의 생성 방 식 은 어떻게 할 것인지, 음 원 과 성도 기 능 을 직 렬 식 6390806 으 로 연결할 
인지, 병 렬 식 0079181 으 로 연결할 것인지 등 을 두고 연 구 를 거 듭 하면서 [1010 ㅁ 65(01973) 의 병 
식 포 먼트 합 성 기, 11[614<0<13 대 시 라 1. 1987) 등 으로 발전해 갔다. 이러 
포 먼트 합 성 의 경우 처 음 에 음소 단 위 의 소 리 만 생 성 하 고 운 율 의 자 연 발 화 를 복 사 해 사용 
지만 432600717(1966) 이 후 운율 런 직접 생 성 하 기 위한 노 력 이 시 작 되었다. 


뽀 [원 7& 


2. 조 음 기반 음성 합성 
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인 간 의 조음 기 관 을 직 접 적 으로 모 델 링 하 여 합 성 음 을 생 성 하 는 기 술 이다. 규칙 기반 
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그림 5. 조음 기반 음성 합 성 에 사 용 된 성도 모 형 (001@ 
1976; 10134(1982) 에 서 0 


위 그 림 은 006600976) 에 서 제시된 성도 단 면 도 인데, 입 술 의 움 직 임 에 따라 1\, Ｌ, 혁 몸 으 
움 직 임 에 따라 ", % Ｌ, 혀 끝 의 움 직 임 에 따라 8, 비 강 의 개 방 에 대해서는 8, 음 원 에 대해 
서는 2, @, 0 영 역 의 함 수 를 수 학 적 으로 계 산 하여 합 성 음 을 생 성 하는 원 리 이다. 

이 론 적 으로 가장 자 연 음 에 가까운 합 성 음 을 생 성 할 수 있겠지만, 조음 성 
해 수학적 계 산 을 가 능 하 게 해 줄 만큼 조음 자 료 의 축 적 이 충분치 못하여 최 적 화 된 


품 질 을 생 성 하지는 못하고 있다. 
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3. [0004(40060 54344607 40081) 기반 음성 합 
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1004 기반 합 성 의 경우 개별 소 리 의 음향 특성 6060081 1400081807 과 환 경 별 변 화 를 반 
영한 여기 매 개 변수 66018400 20873000[07 를 통 계 적 인 음향 모 델 로 구 현 하여 합 성 하 는 기 법 이 
다. 이 기 법 은 적은 음성 자 료 로도 어느 정도 양호한 음 질 의 합 성 음 을 생 성 하 는 것이 가 능 ㅎ 
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연 성 을 위해서 원 음성 자 료 는 운 율 을 배제한 상 태 에서 녹 음 하기 때문에, 자연스러운 운 율 을 
생 성 하기 위해서는 환 경 과 발 화 의 종 류 에 따른 여러 가지 규 칙 이 필 요 하다. 

1\. 문 자 - 음 성 변 환 시스템 116: 16×+0-576001 

일 반 적 으로 연결 음성 합 성 을 통해 문 자 를 음 성 으로 변 환 하 는 것은 문 자 - 음 성 변 환 시 스템 
119: 1660-500001 이 라고도 하는데, 현재 실 생 활 에서 비교적 일 반 적 으로 쓰이고 있는 기술 


이다. 이 문 자 - 음 성 변 환 시 스 템 의 합성 과 정 은 < 그 림 7> 과 같다. 
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이러한 규 칙 을 활 용 해 운 율 을 예측할 으 든 규 칙 을 적 용 하는 
것이 최 선 이겠지만, 기 존 의 훈련 자 료 를 가장 잘 설 명 하 고 예측할 수 있는 최 적 의 규 칙 만을 
활 용 하고 운 율 의 예 측 에 기 여 하 지 못하는 규 칙 은 활 용 하지 않는다. 경 우 에 따 라 서 는 운 율 의 
예 측 에 기 여 하 지 못하는 규 칙 을 오비 활 용 하게 되면 음성 합 성 기 의 성 능 을 오히려 떨 어 뜨 


리거나 합 성 의 속 도 를 느리게 하 
다 음 으로 실제 기본 단 위 를 서로 연결 000031603100 하 는 과 정 이 필요한데 이 과 정 에서 기 
본 단위 간의 스펙트럼 신호 신 호 를 서로 부드럽게 연결해 주기 위해서 보 간 법 10660010400 

과 유연화 60008106 기 법 이 필 요 하다. 합성 연결 부 위 에 있는 스펙트럼 신 호 간의 불 일 치 가 
크면 합 성 음 이 울 리 거나 튀 게 된다. 보 간 법과 유연화 기 법 으 로 는 1601 ㅅ (0101 5000400046 

076082 000 400; (-370060067 & 144004110465, 1990), 112-72601.4(676046007 10008 2501.40), 

10-0901.6(1006 1200000 09014) 등 이 많이 사용되고 있다. 이러한 기 법 은 기본 단 위 에 있 

는 원 음 성 의 음 향 적 특 질 을 크게 왜 곡 시키지 않 으 면 서도 분 절 음 이 나 발 화 의 길이, 기 본 주파 


고 음향 양 스 
수, 강도 등 을 유 연 하게 조절할 수 있다는 장 점 이 있다. 





[ 외 국 어 교육] 제 17 집 


00 ㅁ 61081 \2 아 004! 「 1 





$001666 알 )0 타 -0200@ 91810818 
욱 우 0016915 \23601020 | | 
' 


그림 8. 11)-2901. ㅅ 기 법 을 활 용 한 피치 조 절 (\404140105 & 1.370016 1995) 


위 그 림 은 107090[ ㅅ 기 법 을 사용해 발 화 의 피 치 를 조 절 하는 방 식 이다. 상 단 은 모음 / 
의 원래 원래 음 파 로 피 치 를 보여줄 수 있는 주 기 는 점 선 으로 표 시 되어 있다. 중 간 은 합 성 음 
에서 구 현 하고자 하는 인 공 적 인 피치 주기로 피 치 를 원 래 의 음 성 보다 08 배 낮게 설 정 하 
한 것이다. 윈 래 의 음 성 의 주 기 와 원하는 주 기 의 연 결 은 화 살 표 로 표 시 되어 있다. 하 단 은 
70-090[4 를 적용한 보 간 법 을 통해 유 연 화 가 이루어진 이후 피 치 가 변 형 된 합 성 음 의 음 파 를 
나타내고 있다. 


\. 음성 합 성 의 실제: 51801. 합 성 기를 이용한 미국 영 어 와 한국어 합성 


6 


어 보 는 과 정 이 


최종 제 품 을 통한 음성 합 성 은 단순히 문 자 를 입 력 하고 산 출 된 합 성 음 을 들 어 보는 
기 때문에 합 성 의 과 정 을 직접 체 험 해 볼 수 없다. 이 책 에 서는 본 인 이 직접 분 절 음 을 선 택 하 
고, 길이 및 기 본 주파수 등 의 운 율 을 조 절 해 볼 수 있는 08801. 음 성 합 성 기를 다루어 보기 
로 한다. 808801. ㅅ 음 성 합 성 기는 벨 기 에 에 기 반 을 눈 12016 『0160001046 06 4040205 의 
1615 188 에 서 주도한 03801. 1 ㅁ 001@ 아 를 통해 개 발 된 것으로 반 음 소 (0101006) 연결 합 성 을 





\6-590016916 29014) 알 고 리 듬 을 사용 
996). 이 연 결 합 성은 반 음 소 를 예 측 된 운 율 에 따라 확 장 하거나 압 축 한 
성 방 식 이다. 반 음 소 간의 불 일 치 는 
스펙트럼 신 호 를 서 는 특 유 의 보 간 법 까 67012007 과 유연 
화 60000408 기 법 을 통해 해 소 하고 있다. 현재 이 합 성 기 법 을 활 용 해 오 - 포 함 해 
( 아 008/1140000816/010 ㅁ 1999) 음 성 합 성 이 가능한 30 여 개 언 어 의 보 
어 있다. 

이 합 성 기 를 사 용 하기 위해서는 우선 홈 페 이 지 인 1[6:// 아 95.[0005.400.06/500016916/ 를 방문 
해 100\71030 페 이 지 에 서 \4801. ㅅ 이 300 70106 중에서 5408801Ｌ ㅅ 6020 는 자 신 의 컴 
퓨터 기 종 에 적합한 프 로 그 램 을 내려 받고, 70106 는 자 신 이 합 성 하 기 를 원하는 언 어 를 선택 
해 내려 받으면 된다. 본 책 에서는 0691( 미 국 영 어 ) 와 171( 한 국 어 ) 을 예로 들어 설 명 하 기 로 
다 

내려 받은 60877 인 448801.4 7001535 를 설 치 한 후, 051 과 101 의 압 축 을 푼다. 설치된 
로 그 램 의 제 어 판 에서 161 과 1701 을 00[20880 로 선택할 수 있다. 두 언어 
02[20050 로 설정해 두어야 한다. 설치된 프 로 그 램 인 \06101 를 열면 아래와 같은 창이 든 
이 창 에서는 반 음 소 를 활 용 한 개별 소 리 와 , 길이, 구 간 별 기 본 주파수 값 을 입 력 할 수 있다. 
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그림 9. \080\01. ㅅ 합 성 기 미 국 영어 음 성 (461) 을 활 용 한 "010016@^ 의 합성 


위 의 예 에서 첫 번째 보 기 는 영 어 의 “00016 를 기 본 주파수 정보 없이 개별 음 소 의 길이 
를 100 밀 리 세 컨 드로 가 정 하고 주어진 반 음 소 를 그대로 활 용 한 입 력 이고 아 래 는 실제로 발화 
된 발 음 의 길 이 와 구 간 별 기 본 주파수 값 을 입 력 하여 합 성 해 본 것이다. 입 력 하는 발 음 기 호 는 
특수 기 호 를 쓸 수 없기 때문에 4901 방 식 의 54402 ㅅ (96001 /69696006【 141001008 마 100601800 
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시 10800 \606, 1997) 전사 방 식 을 사 용 한 다 . 54102 전 사 기 호 는 언 어 별로 위 프 로 그 램 의 
메뉴 가운데 10019-103[2010396 17[010100006 를 선 택 하면 확인할 수 있다. 461 을 03[320850 로 한 
입력 단어 00016 의 경우 묵음 구 간 은 1 [ 피 은 “~, [ 시 는 나 0 [이는 

“@“, 음 절 말 의 [ 피 은 “로 각각 전 사 할 수 있다. 입력 방 식 을 예로 들면 첫 분 절 음 인 “의 


경우 아래와 같다. 


1)", 90002 는 


270 59 10 148 50 160 90 171 


분 절 음 뒤 의 첫 번째 값 "50“ 은 분 절 음 의 길 이 를 밀 리 세컨드 단 위 로 입 력 한 것이고, "10 
148“ 은 그 분 절 음 의 길 이 가 10% 가 진행된 구 간 의 기 본 주 파 수 가 148 라는 의 미 이고, 그 뒤 
: 숫 자 도 각각 50% 29 기 본 주 파 수 가 160 112, 90% 구 간 의 기 본 주 파 수 가 171 [라는 것 

을 나타낸다. 합 성 하는 방 식 은 일 반 인 의 경 우 에는 본 인 의 소 리 를 직접 녹 음 하여 실제 분 절 음 


의 길 이 와 구 간 별 기 본 주 파 수 를 측 정 한 후 위에서 제시된 음성 합 성 기 에 입 력 하는 방 법 도 있 

겠지만, 음성 합 성 을 전 문 적 으로 연 구 하 는 사 람 들 은 합 성 을 위한 문 자 열 이 입 력 되면 입 력 된 

문 자 열 을 분 석 하는 과 정 을 거쳐 가장 적합한 반 음 소 를 선 택 하 고 위에서 제시된 운 을 예측 모 

델 링 을 통해 분 절 음 의 길 이 와 구 간 별 기 본 주파수 값 을 자 동 으로 산 출 해 낸 후 합 성 에 활 용 하 
] 있다 


03[30856 를 사용할 수 있 
다 ( 아 0208/1104060816/(3101 1999). 제 어 판 에서 기본 03120850 를 1071 으 로 선 택 하거나, 아래 그림 
과 같이 기본 0 차 20856 는 그대로 두고 필요할 때 마 다 프 로 그 램 의 첫 번째 선택 메 뉴 를 091 에 
서 171 으 로 수 정 해 주면 된다. 한 국 어 도 전사 방 식 은 54124 방 식 을 쓰고 있는데 전사 기호 
는 영 어 와 마찬가지로 0[36856 선 택 을 완 료 한 후 메 뉴 에서 '10019-70[200890 11010181005 를 
선 택 하면 확인할 수 있다. 
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그림 10. 548801.4 합 성 기 한국어 음 성 001) 을 활 용 한 " 엄 마 "의 합성 


구체적인 합성 방 식 에 상 관 없이 단순히 문 장 을 입 력 한 후 합 성 음 을 00 - 우에 

는 1 따 0://\\\.[011400016.0007/ 를 방문해 지 60070 ㅠ 316@ 를 받 

한 달 간 만 무 료 로 사용할 수 있다는 제 한 이 있다. 같은 곳 을 방 문 하면 다양한 합 성 기를 

합 성 된 합 성 음 을 들 어 볼 수도 있다. 10://\\\.7010860\70270.0040/ 에 서도 한 국 어 를 비롯한 몇 
으 


입 력 해 들 어 볼 수 있다. 


위에서 살펴본 음성 합성 기 술 은 실 생 활 에서 활 용 이 확 산 되고 있는 추 세 이다. 가장 최 근 의 
영문 05 가 설 치 되어 있다면 음성 인 식 과 합성 기술, 자연어 처리 기술, 인터넷 검색 기 술 이 
접 목 되어 다음 그 림 과 같이 스 마 트 폰 사 용 자 와 스 마 트 폰 과 의 양방향 대 화 도 가 능 하 다. 양방향 
때 화 의 원 리 는 일단 위에서 언 0 느 음성 인식 기 술 을 활 용 하여 스 마 트 폰 사 용 자 의 음 성 을 인 
식 한 후 그것에 해 당 하 는 수 행 하거나 사 용 자 가 원하는 정 보 를 인 터 넷 을 실 시 간 으 로 
검 색 하여 화 자 에게 합 성 해 는 것이다. 스 마 트 폰 은 사 용 자 가 직접 손 으로 입 력 해 검 색 하 
는 작 업 을 대신 수 행 하고 그것을 문 자 와 합 성 음 으로 제 공 하는 것이다. 실 시 간 으로 검 색 이 이 
루 어 지기 때문에 제 공 되는 정 보 는 역 동 성 을 지니고 있다고 할 수 있다. 

최 근 에는 자동 통 역 기가 개 발 되어 이 자동 통 역 기를 활 용 해 해 외 여 행 을 갔을 때 휴 대 가 

한 스 마 트 폰 만 들고 가면 방 문 국 의 언 어 에 대한 지 식 이 없더라도 스 마 트 폰 이 우 리 말 을 
| 한 후 그것을 해당 외 국 어 로 변 환 하여 합 성 한 후 현 지 인 에게 들 려 주고 현 지 인 은 우리말 

필요 없이 현 지 어 를 이야기 하면 현 지 어 를 인 식 한 후 우 리 말 로 변 환 하여 합 성 한 후 본 
에게 들 려 주게 된다. 그 과 정 을 그 림 으로 도 
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과 거 에는 이러한 휴대용 기 기 를 활 용 하는 것이 불 가 능 했기 때문에 음성 기 술 의 발 달 에도 
불 구 하고 자동 통 ㆍ 번 역 기 의 구 현 이 쉽지 않았지만 오 늘 날 에는 이러한 기 술 을 구현할 수 
기 의 소 지 가 일 반 화 되면서 빠른 속 도 로 현 실 화 되고 있다. 
음성 기 술 은 영 어 의 문법 교 육 이나 발음 교 육 을 위해서도 활 용 될 수 있다. 가 상 의 대 
주 ㅇ } 











그림 13. 20618( 가 1 190 의 리듬 교정 프로그램 


\]1[. 음성 합성 기 술 의 미래 
원 리 와 연 결 합 성 의 응용 과 정 을 살 펴 보 았다. 살펴본 것과 
기 술 은 우 리 의 실 생 활 에 다 양 하게 적용될 수 있고, 이를 위해 
부 왔다. 특히 영어 교 육 과 언어 교 육 을 위해서 원어민 없이도 3 
의 음성 합성 기 술 이 실제로 활 용 되고 있다. 하지만 아무리 자연스러운 힙 
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라고 하더라도 인 간 의 감 정 과 같은 것을 운 율 을 통해 완 벽 하게 구 현 하지 못하고 있기 때문에 
담 화 적 이 거나 화 용 적인 연 구 가 더 진행될 필 요 가 있고, 더욱 다양한 실제 음성 자 료 를 구축해 


ㅇ 


운 율 을 예측할 수 있어야 할 것이다. 
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